AI032
Программирование массово параллельных процессоров: Практический подход
Анализ производительности и выполнение модели SIMT
Цели обучения
- Оценить эффективность модели выполнения SIMT на параллельных рабочих нагрузках
- Выявить узкие места производительности, связанные с разветвлением ветвей и сериализацией
- Проанализировать методы скрытия задержек памяти в рамках планирования варпов
- Рассчитать метрики использования и загрузки для ядер GPU